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摘要 : 该 研究 则 在 克隆 Tyl-copia 类 反 转 录 转 座 子 RT 基因 ， 为 分 离 花 生 属 Tyl-copia 类 反 转 
录 转 座 子 全 长 序列 和 研究 其 功能 提供 序列 基础 。 根 据 RT 基因 的 保守 区 设计 简 并 引物 ， 以 两 
АА 染色 体 组 野生 种 花生 “4rachis duranensis” 为 试 材 ， 利 用 PCR 扩 增 其 基因 组 DNA， 回 
收 、 克 隆 和 测序 目的 条 带 后 ， 对 所 获得 序列 进行 生物 信息 学 分 析 。 结 果 表 明 : (1) 目的 条 
带 大 小 约 为 260 bp 大 小 ， 分 别 从 两 份 野生 种 花生 材料 中 克隆 到 41 条 和 27 条 RT 基因 序列 ， 
68 条 序列 的 长 度 变化 范围 为 256 ~270 bp, AT 所 占 比例 范围 为 55.86%~68.42%，AT 5 GC 
比例 范围 为 1.27~2.17， 核 苷 酸 序 列 间 相 似 性 范围 为 49.8%~99.2%， 存 在 较 高 异 质 性 。 (2) 
68 条 序列 被 划分 为 6 个 家 族 ， 家 族 [ 和 JIV 为 主要 成 分 。 (3) 68 条 序列 中 的 19 条 发 生 了 无 
义 突变 ，Arachis duranensis (PI219823) 要 比 Arachis duranensis (P1262133) 的 无 义 突变 率 
高 。 (4) 氨基 酸 序列 间 相 似 性 范围 为 4.7%~100%， 呈 现 高 度 异 质 性 。 (5) 各 家 族 中 代表 
序列 的 蛋白 质 三 级 结构 在 整体 构 型 上 一 致 ,但 在 螺旋 结构 数 、 折 又 结构 数 、 转 角 数 和 和 氨 键 数 
上 存在 较 大 差别 。 C6) 序列 间 保 守 基 序 总 体 一 致 ， 但 也 存在 一 定 变异 ， 呈 现 一 定 异 质 性 ; 
系统 进化 树 将 68 条 序列 分 为 10 类 ， 大 部 分 序列 都 聚 在 A 和 B 两 大 类 中 。 CD 另 有 部 分 
AA 染色 体 组 野生 种 花生 的 RT 基因 序列 与 其 他 物种 植物 的 RT 基因 序列 亲缘 关系 较 近 ， 推 
测 不 同 物种 植物 之 间 可 能 发 生 过 Tyl-copia 类 反 转 录 转 座 子 的 横向 传递 。 该 研究 为 花生 属 基 
于 Tyl-copia 类 反 转 录 转 座 子 的 新 分 子 标记 开发 和 应 用 黄 定 基础 。 

关键 词 : 花生 ，Ty1-copia 类 反 转 录 转 座 子 ， 反 转录 酶 ， 野 生 种 ， 异 质 性 
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事 花 生 种 质 资源 和 遗传 育种 及 分 子 生物 学 研究 ，(E-maiD) 


AA genome 


CAI Tiecheng!, LIU Junxian?, ZHANG Chong!, LIU Jing?, YANG Taiy??, JIANG Jing?, HE 
Liangqiong?, HAN Zhuqiang?, TANG Ronghua?, ZHUANG Weijian!, XIONG Еадіап2“ 

(1. College of Plant Protection, Fujian Agriculture and Forestry University, Fuzhou 350002, 
China; 2.Cash Crops Research Institute, Guangxi Academy of Agricultural Sciences, 
Nanning 530007, China; 3.Sugarcane Research Institute, Guangxi Academy of Agricultural 
Sciences/Sugarcane Research Center, Chinese Academy of Agricultural Sciences/Key Laboratory 
of Sugarcane Biotechnology and Genetic Improvement (Guangxi), Ministry of Agriculture and 
Rural Affairs/Guangxi Key Laboratory of Sugarcane Genetic Improvement, Nanning 530007) 
Abstract: The purpose of this study was to clone the RT genes of Ty1-copia-like retrotransposons, 
and to provide sequences basis for isolating the full-length sequences of Tyl-copia-like 
retrotransposons and studying their function in genus Arachis. Degenerate primers were designed 
according to the conserved region of RT genes, the genomic DNA of wild peanut species “Arachis 
duranensis” with AA genome was amplified by PCR using the degenerated primers. The amplified 
targeted bands were recovered, cloned and sequenced, and then sequences were analyzed through 
bioinformatics strategy. The results were as follows: (1) The amplified targeted bands were all 
about 260 bp in size. Forty-one and twenty-seven RT genes sequences were cloned from the two 
wild peanut species respectively. The length of sixty-eight sequences varied from 256 bp to 270 bp. 
The proportion of AT, AT/GC and the similarity between nucleotide sequences ranged from 
55.86% to 68.42%, 1.27% to 2.17%, and 49.8% to 99.2% respectively, showing a higher 
heterogeneity. (2) The sixty-eight sequences were divided into six families, family I and family IV 
were the main components. (3) Nineteen of sixty-eight sequences had nonsense mutations, and 
Arachis duranensis (PI219823) had a higher nonsense mutations rate than Arachis duranensis 
(PI262133). (4) The similarity between amino acid sequences ranged from 4.7% to 100%, 
showing high heterogeneity. (5) The tertiary structures of proteins representing sequences in each 
family were basically similar in overall configuration, but there were great differences in the 
number of helix structures, folding structures, turns and hydrogen bonds. (6) The conserved motifs 
among sequences were generally consistent, but there were also some variations, showing a 
certain degree of heterogeneity. The phylogenetic tree divided sixty-eight sequences into ten 
classes. Most of sequences are clustered in A and B classes. (7) Some of RT genes sequences from 
two wild peanut species with AA genome were closely related to RT genes sequences from other 
plant species, which indicated that there might be transposon horizontal transmission between 
them. This study laid a foundation for the development and application of new molecular markers 

based on Ty1-copia-like retrotransposons in genus Arachis. 
Key words: peanut, Tyl-copia-like retrotransposons, reverse transcriptase , wild species , 
heterogeneity 

花生 被 誉 为 “长生 果 ”， 全 世界 有 106 个 国家 种 植 。 花 生 是 我 国 主要 食用 油 原料 ， 我 国 是 
世界 上 重要 的 花生 生产 国 。 当 前 我 国 选 育 出 的 花生 品种 主要 是 利用 传统 杂交 育种 , 但 存在 周 
期 长 、 效 率 低 、 目 的 性 不 强 等 缺点 ， 而 分 子 育种 可 以 加 速 育种 进程 ， 但 是 缺少 简单 实用 高 效 
的 DNA 分 子 标记 。 在 花生 上 , 传统 分 子 标记 技术 想 检 测 出 丰富 多 态 性 十 分 困难 (能 发 前 等 ， 
2010: 王强 等 ，2010; Xiong etal., 2011) ， 昌 然 近 几 年 在 花生 上 也 有 利用 SNP 标记 进行 关 
联 及 连锁 分 析 的 研究 报道 (Zhang et al., 2017; Han et al., 2018; Wang et al., 2018) ， 但 当前 
在 花生 上 使 用 最 广泛 的 是 SSR 标记 , 但 能 在 任意 两 个 栽培 种 花生 品种 间 检 测 出 DNA 多 态 性 
的 SSR 标记 引物 对 还 比较 匮乏 〈 熊 发 前 等 ，2010; Xiong etal., 201). 


LTR 反 转 录 转 座 子 主要 包括 Ту1-соріа 和 Ty3-gypsy 两 大 类 (Kumar & Bennetzen, 1999; 
Feschotte et al., 2002; Вопсһеу & Parisod, 2013) ， 这 两 类 LTR 反 转 录 转 座 子 中 的 RT 基因 序 
列 都 可 以 通过 简 并 PCR 技术 扩 增 克隆 CVoytas et al., 1992; Kumekawa et al., 1999) . ІЛЕ 
反 转 录 转 座 子 具有 的 普遍 性 、 高 拷贝 、 高 度 异 质 性 和 插入 位 点 多 态 性 等 特性 使 其 非常 适合 开 
发 分 子 标记 。 
有 到 目前 为 止 ， 在 花生 上 尚未 见 到 基于 LTR 反 转 录 转 座 子 开发 分 子 标记 的 研究 报道 。 
而 分 离 和 鉴定 LTR 反 转 录 转 座 子 是 分 子 标记 开发 利用 的 前 提 。 花 生 LTR 反 转 录 转 座 子 的 看 
究 报道 稀少 ，Nielen 等 先后 分 离 出 花生 Ty3-gypsy 类 反 转 录 转 座 子 的 FIDEL ЖІ Tyl-copia 类 
反 转 录 转 座 子 的 Matita, X} FIDEL 和 Matita 的 特性 和 作用 进行 了 分 析 (Nielen et al., 2010, 
2012) 。 笔 者 曾 系统 对 花生 LTR 反 转 录 转 座 子 和 MITE 转 座 子 的 分 离 及 其 应 用 的 国内 外 研 
究 现状 及 进展 进行 了 归纳 〈 能 发 前 等 ，2017) 。 

本 研究 拟 从 两 份 АА 染色 体 组 野生 种 花生 材料 “4rachis duranensis” 中 克隆 Tyl-copia 类 
反 转 录 转 座 子 RT 基因 ， 分 析 其 序列 特征 和 多 样 性 ， 为 分 离 花 生 属 Tyl-copia 类 反 转 录 转 座 
子 全 长 序列 和 研究 其 功能 提供 序列 基础 ， 为 花生 属 基于 Tyl-copia 类 反 转 录 转 座 子 的 新 分 子 
标记 开发 和 应 用 葛 定 基础 。 
1 材料 与 方法 
1. 1 供 试 材料 
在 广西 农业 科学 院 武 鸣 里 建 科研 基地 的 花生 野生 转 里 随机 摘 取 两 份 АА 染色 体 组 野生 
种 花生 材料 “4rachis duranensis”(PI262133) 和 “4rachis duranensis”(PI219823) 各 5 株 健 康 
植株 的 顶端 蕊 叶 进 行 混合 。 

1.2 基因 组 DNA 的 提取 

花生 高 质量 基因 组 DNA. 的 提取 采用 改良 СТАВ 法 《能 发 前 等 ，2019) 。 
1.3 RT 基因 的 PCR 扩 增 

上 游 引 物 为 : RTpl : 5’-ACNGCNTTYYTNCAYGG-3”， 下 游 引 物 为 : RTp2: 
5°-АВСАТЕТСВТСМАСВТА-3°, Ж, R=A/G, Ү-С/Т, N-A/T/C/G (Kumar et al.,1997) 。 
PCR 扩 增 体系 和 扩 增 程序 以 及 PCR 产物 的 分 离 检测 参考 报道 文献 进行 能 发 前 等 ,2019) 。 
1.4 PCR 产物 的 回收 、 克 隆 及 测序 

参考 报道 文献 进行 〈 阳 太 亿 等 ，2019) 。 

1.5 RT 基因 的 序列 分 析 
序列 相似 性 检索 、 序 列 统计 分 析 、 序 列 图 及 Logo 图 的 生成 、 和 蛋白 二 级 结构 与 三 级 结构 
预测 、 蛋白 三 级 结构 的 转角 数 和 氢 键 数 统计 、 保守 基 序 预测 等 参考 报道 文献 进行 ( 阳 太 亿 等 ， 
2019) 。 运 用 MEGA6.0 软件 的 邻接 法 (No. of differences 模型 ) 构建 系统 进化 树 ， 自 展 值 
设置 为 1000， 所 用 其 他 物种 植物 的 Tyl-copia 类 反 转 录 转 座 子 RT 基因 序列 信息 见 表 1。 
dd 部 分 其 他 物种 植物 的 TyI-copia 类 反 转 录 转 座 子 RT 基因 序列 信息 


Table 1 The amino acid sequences information of reverse transcriptase of Ty1-copia-like 
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retrotransposons from some other plant species 


Ж) 物种 登录 号 

Family Species Accession Хо. 
烟草 Nicotania tabacum AAA03507.1 

HR} Solanaceae 1,%%% Solanum tuberosum CAA13067.1 
辣椒 Capsicum annuum AFS89521.1 
番茄 Lycopersicon esculentum AAC34611.1 


ӘЖ) Fabaceae ЕШЕЗ Cicer arietinum CAD59770.1 


不 本 科 Poaceae 


ЖЕЛІГІ. Rosaceae 


ЖІ. Chenopodiaceae 
十 字 花 科 Brassicaceae 


山茶 科 Theaceae 
松 科 Pinaceae 

ЖЖ) 
五 加 科 
葡萄 科 


2 SURG 


Amaryllidaceae 


Araliaceae 


Vitaceae 


绿豆 Vigna radiata 
绿豆 Vigna radiata 
绿豆 Vigna radiata 
XX Glycine max 

ЖАЙ Oryza sativa 

玉米 Zea mays 

大 狗 尾 草 Setaria faberi 
苹果 Malus domestica 
梅花 Prunus mume 


Lu 


李子 Prunus salicina 

4837 Chenopodium quinoa 
拟 南 芥 Arabidopsis thaliana 
菜 Brassica napus 

时 茶树 Camellia sinensis 
欧洲 云 杉 Picea abies 


РЕЙ 


Hak Lycoris radiata 
西洋 参 Panax quinquefolius 
葡萄 Vitis vinifera 


24 RT 基因 的 PCR 扩 增 及 测序 


(PD19823) 的 基因 
约 260 bp 的 特异 条 人 带 


(图 1) 。 将 目的 条 带 


进行 


AAT90460.1 
AAT90479.1 
AAT90494.1 
Е47759 
AAA33902.1 
AAK84849.1 
AAL36472.1 
ABS11062.1 
ABF57071.1 
AGX45518.1 
AEX61031.1 
571291 
AAA32987.1 
CAJ09751.1 
CAA11921 
CAA11484.1 
ABU94811.1 
CAN67451.1 


(РІ262133) 和 Arachis duranensis (P1219823) 中 分 别 获得 了 42 条 和 38 条 序列 。 


DNAMAN 软件 去 除 相 同 序列 ， 利 用 NCBI 数据 库 对 序列 进行 
列 ， 最 后 从 Arachis duranensis (PI262133) 和 Arachis duranensis (PI219823) 中 分 别 获 得 了 


进行 多 重 比 对 (图 
3) 。 
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(А) M: DL2000 marker, 1: 


аиғапепвіз(Р1219823). 


图 1 
Fig. 1 


41 条 和 27 条 目标 序列 ， 并 分 别 命 名 为 AdRTI-X ЖІ АЯКТ2-Х C 1) 。 对 1 
2), 利用 weblogo 生成 了 序列 logo 图 以 展示 每 个 位 置 上 碱 基 的 保守 性 
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Arachis duranensis 中 Tyl-copia 类 反 转 录 转 座 子 RT 
PCR amplification of reverse transcriptase of Ty1-copia-like retrotransposons from 


Arachis duranensis 


M 


Arachis duranensis(PI262133); (B) M: DL2000 marker, 1: 


同 源 性 分 析 进 而 去 除非 目 


文 些 RT 基因 


Arachis 


基因 的 PCR М 


色 体 组 野生 种 花生 材料 “4rachis duranensis” CPI262133) 和 “Arachis duranensis” 
组 DNA 进行 PCR 335, 结果 显示 , 在 2 份 花生 材料 中 都 扩 增 出 了 大 
回收 、 克 隆 和 测序 ， 从 Arachis duranensis 
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利用 
标 序 


序列 
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AdRT1-1/1-266 
AdRT1-2/1-266 

AdRT1-411-266 

AdRT1.611-266 

AdRT1-711-266 

AdRT1-8/1-266 

AdRT1-911-266 

AdRT1-11/1-267 
AdRT1-1211-266 
 AdRT1-13/1-266 
AdRT1-14/1-266 
AdRT1-15/1-266 
AdRT1-16/1-262 
AdRT1-1711-266 
AdRT1-1911-266 
 AdRTI-21/1-266 
AdRT1-2211-266 
AdRT1-2311-265 
AdRT1-24/1-266 
AdRT1-2511-266 
AdRT1-26/1-266 
AdRT1-28/1-266 
AdRT1-2911-266 
AdRT1-30/1-266 
AdRT1-31/1-266 
AdRT1-32/1-266 
AdRT1-33/1-266 
AdRT1-34/1-266 
AdRT1-35/1-266 
AdRT1-36/1-266 
AdRT1-3711-266 
AdRT1-38/1-266 
AdRT1-39/1-266 
AdRT1-40/1-266 
AdRT1-41/1-266 
AdRT1-42/1-266 
AdRT1-43/1-266 
AdRT1-45/1-266 
AdRT1-4611-266 
AdRT1-4711-256 
AdRT1-48/1-266 
AdRT2-1/1-266 

AdRT2-2/1-266 

AdRT2-3/1-266 

AdRT2-411-266 

 AdRT2-5/1-267. 

AdRT2-711-270 

AdRT2-911-266 

AdRT2-1011-262 
AdRT2-11/1-266 
 AdRT2-13/1-266 
 AdRT2-14/1-266 
AdRT2-15/1-266 
 AdRT2-16/1-266 
 AdRT2-18/1-266 
 AdRT2-19/1-263. 
AdRT2-21/1-267 
 AdRT2-24/1-257 
 AdRT2-27/1-266 
AdRT2-37/1-266 
AdRT2-38/1-266 
AdRT2-39/1-266 
 AdRT2-40/1-266 
 AdRT2-41/1-266 
AdRT2-42/1-266 
AdRT2-43/1-266 
AdRT2-45/1-267 
AdRT2-48/1-266 


AdRT1-1/1-266 
AdRT1-211-266 

AdRT1-4/1-266 

 AdRT1-8/1-266 

AdRT1-7/1-266 

AdRT1-8/1-266 

AdRT1-9/1-266 

AdRT1-11/1-267 
AdRT1-12/1-266 
AdRT1-13/1-266 
AdRT1-14/1-266 
AdRT1-1511-266 
AdRT1-1611-262 
AdRT1-1711-266 
AdRT1-19/1-266 
AdRT1-21/1-266 
 AdRT1-22/1-266 
 AdRT1-23/1-265 
AdRT1-24/1-266 
 AdRT1-28/1-266 
 AdRT1-26/1-266 
AdRT1-28/1-266 
 AdRT1-29/1-266 
AdRT1-30/1-266 
AdRT1-31/1-266 
AdRT1-32/1-266 
AdRT1-33/1-266 
AdRT1-34/1-266 
AdRT1-35/1-266 
AdRT1-36/1-266 
AdRT1-3711-266 
AdRT1-3811-266 
AdRT1-3911-266 
AdRT1-40/1-266 
AdRT1-41/1-266 
AdRT1-42/1-266 
AdRT1-43/1-266 
AdRT1-45/1-266 
AdRT1-46/1-266 
AdRT1-47/1-256 
AdRT1-48/1-266 
AdRT2-1/1-266 

AdRT2-2/1-266 

AdRT2-3/1-266 

AdRT2-4/1-266 

AdRT2-5/1-267 

AdRT2-711-270 

AdRT2-911-266 

AdRT2-1011-262 
AdRT2-11/1-266 
AdRT2-13/1-266 
 AdRT2-14/1-266 
AdRT2-15/1-266 
AdRT2-1611-266 
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KG BÉTTETERTEATGSTSR: 1 RaGR A RCBRGR- -fc DRc ATE Ac CNREE SNc Egite r 181 ARREA NAc ERAS RTTE 15086. ANGcEERRGARcRo -cir AREE T To RAGGRABE  BERRGA cAC ЩЕ 
ЕСАБСТТТТСТТСАСБФОАСААСТТОААСААСАСА --ТАТАТАТаОСТССААССАСААООТТТТСААЛБАЛААЛАОСААААСААААСТТСӘТТТОС--АССТТААСТАААТСТСТСОТАСООТСТААМАОСАСОСССОСААӨСТСОСТТӘ 
ҺіссестісбтсБАтоолоАасттоААоВАбАСА..ТАТАТАТОСтСӘААСТАБААБАТТТТОААБААСААООААЛАТАЛААСТТСОТТТ06.- АСоТТААСТАААтстотоТАсӘбтсТАҺАОТАс06с6тААбстот Тб 
ҺатсеттттсттсАтсотбАттТАСАТАЙСФАСА. -ПСТАСАТОСАСФААСВОбАСӨбстттстт От  ARAGGAAACBAAGATTTTBTATGG -AAGCTTAAGAAGAGT - 737 TATSGGT TG AAGGAAGE T BÓAAGA CACTO 
КСТОСТТТТТТТСАТОСТСАТСТТААССАТСААА--ТТТАТАТСОСААСААССОСТСОААСООТТТСАТСОТААААСАТАААСАССАТСАТӨТТТОС-АААТТСААСААСАСА -ТТСОТАТОбСТТСААОСААОСТСОСААСАСААТА 
КСССООТТТТТТТСАТОСАСОААЛСТТСОААСААСААА--ТАТАТАТастссААССАСААЛООТТТТАЛАОТАСААООАСААЛСФАЛААСТТАВТТТОС--АССТТАССТАААТСТСТСОТАСОбӨТСТАМАССАСОСССОСААвСстсттӘ 
RdcBG^ ETTCRTGATOGTGAT т AGAT AR GBAGA - - lr FACATGoAGARAGGABACBGCRTEGT rBr ARAGGARACBAAGRTTI ioe ARGCETARGRAG A r cil PATGGGTRcAAGEAABETBOARGACACTS 
Ro GETTETITTEATGG A AA. - Rr PACRRGGAABAAGGT САА ССТ IBICACABTAARGBBCRAABACGRTCATBCTIGG -AR^CECRAGARGRGC - rGPATBGCTRGAAGT ABE r GAMBA CAA ТЕ 
RGABGCTTTTTABATGGTORr т TAGATAACGAGA . - Rc PACATGGAGBAAGGoBACBGCTTECT TOT T ARRGGAAACBAAGATISTBToTGG -ARGCTEAAGAAoAGT -CTT TATSGGTTGAAGEAAGE T BOAABA CACTO 
AGTBEGTTTTTTPATGGTGATTTAGATAAGGAGA- -TCTACATGGAGEAAGOEGGAGBGCTTTGT!TBT TAAAGGAAAGGAAGATTT TGTGTGO -AAGCTTAAGAAGAGT-CTTTATGGGTTGAAGOAAGOTDOAAGACAGTG 
КСССОСТТТТТТТСАТОСАСААЛСТТАЙААСАССАТА--ТАТАТАТОСТСбОААССАСААЛООТТТТСОААЛБААСААОСАЛААСАЛАЛАСТТСӘТТІСС--АССТТААСТАААТСТСТОТАСООТСТАМАССАСВОСОСААССТСстТТОӘ 
RacBGTETTTTTCATGGTGAT 7 JAGAT ARGBAGA - - Ic FACATGoAGGAAGOCBACBG CTTTOT BT7ARAGGARACBAAGATTT GTC TGG - AAGCTTARGRAGAG T - C] 7 TATGGGTRCAAGGAAG; TEGARGA CACTÓ 
ШіссеттістттсатсотватстасосойлбАсс..ШттАсатасаселассссствостттетттстсаясвсстотттосатТАбТтт06.-АхорТослатоттслл(статббостсалАБААТВсбасАлАтсатб 
МатветттттттсАтсотвАтт TAGRCAAGGAGR - ПСТАсАтослсСААССсЗАсеСстТтсттбттАААССААДСВААСЯТТТтОтоТ6С лАссттАДслАсАст .ci TATGGCT TG AAGGAABG T GGAAGBA CACTG 
КССОСТТТТТТССАТОСТСАСАТАСАТАААСАЛА- -ТСТАТАТОСАССААССАСАСВОТТТССАСОТТАААССААЛАССАССАССТТӘТАТСОС-ААСТТСААСААСАСС-ТТАТАТООСОСТТАҺАССААСОССССААСССАСТО 
ЕСОСӘССТТТТТОСАТСООССАТСТТААССАТОААА--ТТТАСАТаОСААЛСААССТОААОбОТТТСАТСОВТАААСВОСАААФАССАТСАТВӘТТТОС-АААСТАААСААСАСС-тТТСОТАТОВбСТТСААССААОСТСОСААСАССАТО 
ШесбстттттттсатовтоАтттАСАТААСВАСА. -ТстАСАТасАссААСОобАсбастТТоттӘтт A NA AAA т BToTGG Аст ААС ААсАст .ci TATGGSTISAAGCAAGCTCCAAGACCGTG 
Шісбетттт.ТсБАтоотоАтттасАСАЙСОАСА..СТАСАТОСАСӘААСССААСБАСТТТСТтОТТАЙАСФАААСОААОАТТТТОТ7с706.ААССТТААСААСАСТ - ARrATABoTEGRABEARBE Cea cach 
ССТТ ТСАТООАОЛАСТТОААОМАСАСА.-ДАТАТАТОстсӘААССАВААӘВТТТТСААОААСААСОЛАЛАСАЛААСТТСОТТ106. -АсорТААСТАААТСТӘТОТА СВЕТ cia МАССАСС СС СААСстст [е 
КСССОСТТТТТТССАТОСАСААСТТСОААСААСАСА - -ТАТАТАТОСТССААССАБААООТТТТСААЛБААСААОСОААААСААААСТТСӘӨТТТОС--АССТТААСТАААТСТСТОТАСООтСТАМАССАСОССОСААОСТСтТТӘ 
КСОСОСАТТТТТССАТОСАСААЛСТТСОААЛСААСАСА--ТАТАТАТОСТСБААССАСААВОТТТТСААЛОААСААООААЛААСААААСТТСОВӘТТТОС--АССОТТААСТАААТСТСТОТАСООӘТСТАҺАССАСВӘСОССОСААВСОСТСТТӘ 
ШЕСБОтТТТТІССАТОСАОААСТТОтАОЙАВАОВ.-ТАҒАТАТОСтсбААССАВАЛОВТТТЕСААВААСҚАФОАЙААБААЛАСТІС1 T TOC - Аст тААСтТААЙТт ст стотАсббтс АЛАФСАСВЕСБСААСстот76 
Re^ GGcITETETG DATO TOR RAGRCGRABRAR - - Rr PACREGTATBAAGG T BACBOT RR CAACBTTOAGBG T RAABAAARTCAGBQA ROT .-СССФТАЙАЯАААТСАСТАТАТОФАТТСАЛАБААТЕттбт сӘЯСАСТО 
RGrGGATTTTTTGATGGTOAT T TAGA T ARGGAGA - - RC TACATGGAGDAAGGOBACBGCTTTG 8T t AMAGGAAACBAAGATIET AToTGB - ANGCTTAAGAAGAGT - C37] CTGGGTTGAAGGAABG rÉCRAGA cACTG 
AG^BCTTTTITTITOCATGGTGAT T T^AGACAAGGAGA - TT TACATGGAGGAAGOGGAGBGCTTTG T TBTTAAAGGAAAGGAAGATTT TGTGTGO -AAGCTTAAGAAGAGT-CTTTATGGGTTGAAGCAAGO T CCAAGACAGTG 
КСТОСТТТТТТССАТОСАСААЛСТТСОААЛСААСАСА--ТАТАТАТОСТСБААССАСААВОТТТТСААЛОААЛАААССААЛААСААЛААСТТСАТТТОС- -AGcEREANCTAANTCTCEGPACBBT CEABAGOXG r Ec BERAGG Tc T PG 
Re. Be ci oN CR ABAGA- ПАДАТ TOC T CDRAGGABAABE T eA CRAGGARAABAAA ACRI CBT T TC - -АсоттААСТИАЙТ стос Ассот с АААССАс Вс СААСс oi 
ШС,БСтттТТТТСАТООТОАТТТАСАСААСӘААА..ТСТАСАТОСАССААССОСАСФЕСТТТАттӘТТАААСААААСФААСАТТТТ070766- ARGCEPARGRAGRG r .ail PATBBGTRCAAGEAABOTBEARGACACIS 
МасветтттттоблтсотвАттТАСАТАЙСФАСА. - C TACATGGAGDAAGOGBACBGCTTRoTTBT т ARAGGAARCBAAGATTTTBToTGG -ARGcRTAAGARGAGT .ci ТАтСстсААССААСОТССААСАСАСТС 
КССОССТТТТТССАТСОСОТСАТТТАСАТААССАСА- -ТСТАСАТОСАССААСССОбФАСООСТТТСТТбОТТАААССААЛАССААСАТТТТОТСТСОС-ААССТТААСААСАСТ -СТТТАТООСТТСААСОСААОСТСОСААСАСАСТО 
AGCGCTTTTTTGECATGGTGATTTAGATAAGGAGA- -TCTACATGGAGCAACCGGAGGGCTTTCTTBTTAAAGGAAAGGAAGATTTTGTGTGC -AAGCTTAAGAAGAGT-CTTTATGGGTTGAAGCAAGCTCCAAGACAGTG 
ШОсбесттттттСАТОСАОААСТТАЙАОЛАБАТА.-ТАҒАТАТОСТСОААССАВААОВТТТТОААВААСААООАЙААӘААААСТТс 611166. Асс ртААстАлА тст скс Ассо сВАААССАс рс СА Сс тот 
КССОСТТТТТТТСАСОФСАСААЛСТТОААСААСАСА--ТАТАТАТаОСТССААССАОААООТТТТСААЛБАЛАААССААААСААААСТТСОТТТОС--АССОТТААСТААЛАТСТСТОТАСООТСсТАААОСАСОССССААӨСТСоСтТӘ 
САСЕСТтттТоБАТООХАсАСТТОААСААСАСА..ТАТАТАТОСТСБААСОААЛАБОТТТТАЛАОААСААСОААЛАЛАЛААСТТСОТТтТО6..АСоРТААСТАААтстоТоАСЫВтСТАЙАОСАСӨ6с6СААСстст 16 
ҺстбесттттттсатодтВАттТАСАТААСӘААЙ- - IcTACATGGAGGAAGOCBACBG CTTTGT 1877 ARAGGAAAGBAAGATTTTGTOTGC - AAGCITAAGAAGAGT -CTT TATGGCTICAAGCAAGCTCOCAAGACAGTG 
КССОСТТТТТТТСАТОСАСААСТТСОААЛСААСАЛА- -ТТТАТАТОСТСБААСОТОААОФОТТТТСААБААЛАААСОСААААСААСАТТТСОТТТОС- -ААСТТСАСТАААТсСТСТОТАТООТСТАҺАССАСВОСОССОСААСОСТСтТТӘ 
lia^BGTEICERTGATGGTGAT 7T AGACAAGGAGA. - [cTACATGGAGGAAGOCBACBG CTTTGT 187 T ARAGGARACBAAGATTI Soi - AAGCTTAAGARAGAG T -CIT TATGGCTICAAGCAAGCTECAAGACACTG 
КССОСТТТТТТТСАТОСААЛААТТТСОААСААСАСА--ТАТАТАТОСТССААССАСААООТТТТСААЛБААСААООААААСААААСТТСӘТТТОС--АССТТААСТАААТСТСТСОТАСООТСТААМАОСАСОСССОСААӨСТСтТТӘ 
СССетттттттсАТООАВААСТТОААСВАВАСА. ПАТАТ АТСстСОААССАСАА СТ ПЕТЕ АСАААДАСАААААСАА А АстосСтт 160. АесвтААстАхАтстототАс атто КАССАССССССАА стст 
О BGTETIST ССА ТСО -BAc7]occcoRABT rc - ДВА ТАТ^тсобсАССАст ABB T CIIGA TB соо -----сттВоса й Sie. АлосрАстслстслодс АТСВАС ААА лтосаестоттостАс е 
Ré: GO TIT T OATGO TOR^ cR rGH^ GRABAR - ДАТАТА Se БААТ сП Тел ABA ^T САВХИ АВАХ Аст сс тт ст. Ахл Ш АЯ сСААИтстодотАс Сото ЕСА ССС ВСА тОАтст Е 
HacBGTETTTTTCATGGTGAT 7 JAGAT ARCBAGA-- ПсТАссасдсСААСССВАсО Вст тсттотт ARAGGARACBAAGATTT TGTOTGE- AAGCTTAAGAAGAGT . cil ТАтбестсААССААВСТССАХСАСАСТС 
lidcBerpIcERTGATSGTGAT io ARGBAGA - -Hide EN ERE er  ARAGGARAGBAA r ATTI T BToTGG - ABA CETARGARG Re r Пт PATGGG TR AAGGAABGTBGARGA CAG]G 
САСесттттттсатоотоАтттАСАТАЙСФАСА..ПСТАСАТФСАСӘЛАСССФАСФОСТТТСТтОТТАМАСОАААСОААСАТТТТб7сТ06. ААОСТТААСААСАСТ -СТТТАТООСтТСААОСААОСТССААСАСАСТО 
RGABGTTTTTTTGATGGTGAT T TAGA T ARGGAGA - - RC TACATGGAGBAAGOGBACBGCTTTG T T8T T ARAGGAAAGBAAGATTTTBTOTGG -AAGCTTAAGAAGAGT .CTTTATGGGTICAAGCAAGCTCCAAGACACTG 
ЕСАСОСТТТТТТТСАТОСТАЙАСТТОААСААЛААААААТАТАТАТастсБААССААЛААВОСТТТСААЛВААССАА -ABNABAAABRCEEGBETTEGE--BGcECAACcCAANTCTORGCACBSCTE^BAGOATTE^BEGAGATATEA 
G^ BG-ITETITTEATGO TOR r cr ^ AcoRTBAAR - - Rr PACATGGAADAAGG  BA^BGT [HIA To BT AARAGBCAAABACGATCATBI TTG -AR^CToRAGAAoRGc - rRofATOG cTToMAGGARBE! CCRAGA cAc TB 
ҺстсетттттттсАтоотбАттТАСАТАЙСФАЗА..ПСТАСАТОСАСФААССОБАСФосТТТоттОттАМАСФАААСВААСАТ 075706 -ААССТТААСААСАст .ci TATGGCTICAAGCAAGCTECAAGACAATG 
ШС,Бстттттттсатсстсатстасосойлвясс. .ТттАСАТасассААссосстостттотттстсһдобостстттасатТабТтІ66.-ДАсттосллтоттслАРсРАТОбАСИОАААБААТЕСБОСАААТСАТО 
(ТІЗІ ТЕҮШІПСЕИРГІ ЕР ПІ EIRGA ABA Ar CRGA ARA Ea ee Асс ШЕРГІЛІС EGA CORAS Tc cia 
AGcBETPETISITEATGGABAMACETGAAGRABAGA--P^APATATGCTCEOAAGOAGBAABGTPITEGAABAACAAGGARAAGAAAAR CEEGBITEGE--AGcGEEAMCTARAMTCTCEGPACBGTCEARAGOAGBTGESAMGG тст Вт 
HOA BOTERISUIc САТССТСАА ci A GRABAR ПАДАТ АТОстсСААССА EN BSc eA Nee SAAN i. Ало AM ccRAR rcr стс CBO TIT АА66сс6тс6сААбАТот|8 
E:T ee cR rGA ^ CRABAAR - ДАДАТ АТОстсСААССАСАлООст тел лахт TAGGARAABARA AC CBT T TOC - -АСТТААССИАЙТ стсТтотАсбвст Redcar Boe ci 
RGcBGCIETETTDATGGTOR r7 ГАСА r A Na - - RCPACATGGAGDAAGGGGACBGCETRG r 87 rARAGGARACBAAGATITTBTCTGG -ARGCETARGAAoRGT .СТтТАТбастТСААОСЖАО6ТССААСАСАСТО 
RacBeTETTTTTGATGG cBAT cT rA RcoR TBAAR- Тт PACATGGAAGAAGO  BAABG T То слтсбтлАААСССААлСАссйтслтбтт 66 ААлсроАсААсАос - ro PATGG cT NA T BGARGA CAG T 
КСТОСТТІСТТТСАТОСОСОСААЛТТСАААСААСбААС - -ТСТАСАТОСААССТ ФТССАБФАТТСТСТВАААААТТССАСАЙААЛАТСААВТТТОО- -БААТТАМААААССОСТСТСТАТФФАСТСВААБААТЕОСОСАСВФтсссТтӘ 
HG-BOT ETC Rr GARGG cBAT cT rA con T BAAR- - Ir AT AYGGAABERET rBRABB ТТ cA TcBTAARCBBr RAABRAGAT CATBY TIT T ARA CRGMA T Асос - ro ATGG Ro AAGAAADTBGAROACA^ 1G 
Roc сетті Nr iA AA - Rr ПАСА Тесттест BEA cA er reco - -----AMrAGTocABRTIBT - -cBocffroncfnercrr]opATEG cH сАЛАБАсВ6таст сбосАотб 
О BET ERIXTTGATSGTGAT CQ cARcABAA TTG. -WrRGCANAARABCREGACTABB rci coTATCTTRT - --ccccrGRTRIABTTTBE- -caaciAsachacterëT oie ci Reece 
Kar Ber TETTTTEATGGCBA rcTr A RcoRTBRAR - -17TA ATGoAADAAGG TEAG iT cA rcBT AARAGBCRAABRCGATCATBI T 160 -ARcRoRAGAAGRGc .hc PATEGCT To AAGGAAGE TEERAA CAG TA 
ЖС,БСтТТТТТТСАТСОТОАТСТСААСАЙААТто..ТтТосАТААМАПСАССАСТАВ тс сстатсттАт ---сссстоАт АСТТТ66. -cAacffcAcA^orcTOQ IGTGBACRCAAGEAAABAAGTRBAAA A] 
ҺасбсттттстосатоотоятттАСАтААОВЖОЙ. ПСВАСАТЕс Ас СЯАССС ВАСЕ тст TETT ARAGGARA T BRAGA TIT T GTAIGC - ARGCETARGARGRG -cil PATGGG T Ro AAGCAABOT  ЖАСАСАСТО 
RacBerETTTTCATOGTGAT ci Nol TBAAR- - |l PACATGGAAGAAGG T BAABG rc^ TCBTAARAGGCARABACGATTATBT T TGG - ABA CRGARGARoAGC - r To PATGG TIC AAGGA AGE T BOARGA CA^ TG 
Hd-BGcERINToGATGGTOAA cR rSA GR ABAAR ДАДАТ ATGCTCBRAGOABAABBCETIGA ABAA rCRGGARAABARARCIRCBTTTGG  -BAcEPARCCRARTCTCRORACBBCTRARAGEA CBE САСА Тот С 
ССТТ CBATGG TOR r iA  AGOBAGA - - c TACATGGAGDAAGOGBACBGC cr ^T ARAGA AAACBAAGATIRETBTA TG -ARGCETAAGAAoAGT -C17 ТАсС аст сААССААСОТ BOAAGA CACTO 
КСТОСАТТТТТТСАТССОССАТСТТААССАТСАЛА- -ТТТАСАТОСААСААССОСТОФААСОТТТСАТАОФТААЛААСООСАААСАССАТТАТӘТТТОС-АДАСТСААСААТАСС-ТТОТАТООСТТСААССААСОСТОСААСАСАСТО 
МасбесттттттсатоотсатттаАСАТААОБАСА. - IcFACATGGAGOAAGOCBAGBG CTTTGT BT T ARAGGARACBAAGATITTBTGITGO - ААОСТТААСААСАст .ir PATGGGTRoAAGGAABGTDEARGA CAGTG 
G^GOTTTTTTcOATOGTGAT!TTAGAT ААСВАСА - T CTACATGGAGDAACOGGAC GG CEEETG T 7 8T T ANAGGAAAGBAAGATTT T BEGTGE - ААССТТААСААСАСТ - CET TATGGG TEGAAGOAAGO r ССААСАСАС С 


135 BEAGRAGRAGIETIGRAFOTGETREGGGGAAGBATBGB т ПЕ сс rRAGACARCETEABATERTIGTG - TABTE стосДАААА АТ т TEGATCATGATIETATCNT----TEXTTEGCETEATGTABACBATAY 500 
138 BIRAGAAGAG л ДСА r BG 7 CARET ^ 7 TAG CB т ТЕЗ ^ ABA A CA ACT TAGIBEBAGBATORTTGRA стл -тАСАЙСАсо с ссСА ТАЛА CAI - --TEXccESTEGPATGEAGATSATAT Стр 
135 ВТАСААСАСАТТТСАТТСТТТСАТТАТТАССбттббАТАСААСАсАсттАсТТТАБАТСАТТОТА-ссТАТ-ТАСАҚсАсоТсТсосТоАТААТбФАТТТСАТСАТ----ТСТостбттоТАсбтсбАСбАСАТ-бтТ 
138 ВТАСААСААСТТТСОААТСТОТТАТссссААсбАТббФТТАтсстААСАСААСТТВАВАТСАТТӨТС-ТАТТТ-стТосАААААТТТтСТсАТСАТФАТТТТАТСАТ----тСТттТосТтТАТОТОбАТбАТАТ-бсТ 
138 ОТАСААСААСТТСБАС ттер тА(сослсАлблАббсТАбААСВАСАСТАСТТОтбАТТАТТОІС-ТАТТІ-сТтАЙАСАСТТ(оСТАСТААТОАТТІТАТТАТ----сӘӨТТТІФАТАРАТОТАСАТСАСАТ-бт| 
138 ВАҺСАҺСАЛАТСТСАТТ6ТтТСАТТАТТАссСбтТббФАТАСААТАсасттАсТТСАБАТБАТТОТА-ссТАТ-тАсАҚсАсоТсТссТбАТАСТФАТТТСАТСАТ - ---ТСТсосТАтТсТАТбТоБАСбАСАТ-бтТ 
138 ВТАСААСААСТТТСОААТСТОТТАТоссосААСвбАТббтТАСсотААСАСААСТТСОАВАТСАТТӘТС-ТАТТТ-сТоСАААААТТ(тСТоАТСАТФАТТТТАТСАТ----ТСТттТбсТтТАТОТАВАССАСАТ-бтТ 
138 БТАСАҺОААСТТТОАс(ссо тА(осслсАлбААЛВАСТАСАЛАЙАСАСТАСТТОтбАТСАТТОТС-ТАПТІтоттАҚАСАОТТ оСТАСТААТОАТТІТАТТАТ----ТӘТТТІВАТАРАСОТАВАССАСА(-бтІ 
138 ВТАСААСААСТТТСОААТСТОТТАТссслААСбАТӨбтТАСсСсотААСАСААСТТСАФАТСАТТОТС-ТАТТТ-стосАААААТТТтсТСАТосТбАТТТТАТСАТ----теТттІтсТтТАТОТобАСбАТАТ-бСТ 
138 ӘТАСААСААСТТТОААТСТОТТАТстсссАсбатббтТАСссотААсАСААСТТСОАБАТСАТТӨТС-ТАТТТ-стосАААААТТ(тсТсАТСАТСАТТТТАТСАТ----ТСТттТбсТтТАТОТСбАСбАТАТ-бсТ 
138 ВТАСАҺСАСАГТТОАТТСТт ТАПТАтТтАссбттӘбАТАСААСАсасттАс . su - T 5-543555 - 8: ENEE 34 us ug c oon 
138 ВТАСААСААСТТТСОААТСТСТТАТссссААСбФАТббтТАСсстААСАСААСТТСАБАТСАТТВТС-ТАТТТ-сТсоСсАААААТТ тСТсАТСАТФАТТТТАТСАТ----ТСТттТасттТАТОТСбАСбАТАТ-бтІ 
138 ӘТттттбАААТТСАССАТ -- -ТТ ттолостттс АЙС -АААСАААссолсоБАБАТСАТТссбттт АТАСТОТСАТААТТСАСААОСОЙААҚсТоттТАсСТ------ТоАТААТОТАТОТАБАТСАСАТ-б6СТ 
135 ВТАСЖАСААСТТТОААТ тс тАТссссААсблтббтТАбсстБАСАСАЙСТТСАВАТСАТТбТС-ТАТТТ-стсосАААААТТ тсТсАТСАТбАТТТТАТСАТ----ТӘТттТбстттАТОТобАСбАТАТ-бтТ 
138 АСС АДАССА Т Ост сАТссллАстбАТббсТАСАСТААСАСТтС ТОтбАТСАТТОТС-ТОТАТ-сТТАЙСАААТТстСТСАТсс ФАТТТТАТАЙТ----ТСТстІӘсТтТАТОТАСАТСАСАТ-бтІ 
138 ВТАСААБААСТТТСАСТСТоТТАТоссаАсААСААОбФСТАСААСВАСАСТАСТТОтбАТСАТТОТС-ТАТТТ-СТТАЙАСАСТТ ссТААТАЕТСАТТТТАТТАТ----сСТТТТбАТАТАТОТАБАТСАСАТ-бсТ 
138 ВТАСТАСААСТТТСОААТСтТсТтАТосссААсбАТӨбтТАтсотААсАСААСТТСОАВАТСАТТОТС-ТАТТТ-стосАлААТТт (тсТсАТСАТВФАТТТТАТСАТ----ТСТттТбӘтТтТАСОТАБАССАСАТ-бтТ 
137 ВТАСИАСААСТТТОААТСТСТТАТсссссАсбАТббтТАбсстААСАСААСТТСАВАТСАТТОТС-ТАТТТ-ТТОоСААААЛАТТ (тсТсАТАСТОФАТТТТСТТАТ- ---TOTTTEGCETPATGTGBATGATAT -6T 
138 БТАСААСАСАТТТСАТТСТт сСАТТАТТАссбттббАТАСААСАсасттАс ТСАБАТСАТТОТА-стТАТ-тАсАҚсАсоТс(ссоТбАТАЙТФАТТТСАТСАТ - ---тСТссТбтТсТАСӘТАСАТСАТАТ-бтІ 
138 ӘТАСААСАСАРТТСОАТТСТт СА тАттАссбттӘб АТАСААСАсасттАс ТСАБАТСАТТОТА-ст АТ-тасАЙсасоФс(ссТсАТАҺТОАТТІСАТСАТ----ТОТАСТӘтІсТАСӘТАБАТСАСА|-бтІ 
120 ӘТАСААСАСАТТТОАТТСТТ САЙТАТТАссбтТбФАТАСААСАсасттАс ТСАбАТСАТТОТА-ст АТ-тасАЙсасоТс ос оАТАҺТОАТТІСАТСАТ----ТӨТссТотІсТАсСОТАСАТСАСАТ-бтІ 
138 ВТАСААСАСАТТТСАТТСТТ сАТЙТАттАссбттббФАТАСААСАсасттАс ТСАВАТСАТТОТА-ст(АТ-тлсАҚсасоФс(ссТоАТААТФАТТІСАТСАТ----Тт ссТатТсТАТОТсбАТбАТАТ-6СТ 
138 ВТАТАҺбссАРТТОАсТОст|ТАТСттААААБААВАТ ттттсВАААоТВАТТАТАЙТТАТТОТС-ТАПАС-АТтсАталост ттІосллсФФАТТАТАТСТА----Тт тс ато АТОТАБАСОАСАТ-бсТ 
138 ВТАФААСААСТТТСААТСТОТТАТстсосАсбАТббтТсбсстААсАСААСТТВАБАТСАТТбОТС-ТАТТТ-стосАлААЛАТТТтСТСАТСАТбАТТТТАТСАТ----ТӘТттТбсттТАТОТобАСбАТАТ-бсТ 
138 ВТАСААСААСТТТСОААТСТОТТАТссоссААсбАТббтТАСссотААСАСААСТТСАФАТСАТТОТС-ТАТТТ-стосААААТТТ тсТсАТСАТСФАТТТТАТСАТ----тСТттТосттТАТОТобАСбАТАТ-бтТ 
120 ӘТАСААСАСАРТТСОАТТСТт СА тАттАссбттбФАТАСААСЕсасттАс САбАТСАТТОТА-сСт АТ -тАСААСАсс с сс оАТАЮТОАТТІСЕТСАТ----ТСТссТӘтІсғАТОТсбАСФАТАТ-60Т7 
138 БТАСААСАСАТТТСАТТСТТ сСАТТАТТАсСбтТӨбАТАСААСАсасттАс ТСАСАТСАТТОТА-ст АТ-тасАҚсасоТс(ссТсАТААТФАТТІСАТСАТ - ---ТСТссТбтТсААТӘТАБАТСАТАТ-бтІ 
138 ВТАСААСААСТТТТААТСТОТТАТоссллАСбАТббтТАССотААСАСААСТТСАБАТСАТТОТС-ТАТТТ-АТОСААААЛАТТТтСТсАТСАТФАТТТТАТСАТ----ТСТттТосТт АСОТобАТСАТАТ-6СТ 
138 ӘТАСААСААСТТТВААТСТс ТАТсосслАсблтббтТАСсстААСАСААСТТСОАВАТСАТТОТС-ТАТТТ-стсосАлАЛАТТ тсТсАТСАТСАТТТТАТСАТ----ТСТттТОсТтТАТОТАСАТСАТАТ-бсТ 
138 ВТАСААСААСТТТСОААТСТСТТАТссссААсбАТббтТАСссотААСАСААСТТСАФАТСАТТОТС-ТАТТТ-стсосАААААТТТтсТсАТСАТСАСТТТАТСАТ - ---ТСТттТосТтТАТОТАСАССАТАТ-бсТ 
138 ӘТАСААСААСТТТОААТСТОТТАТсоссААсбАТббтТАСбсстААСАСААСТТСОАБАТСАТТОТСО-ТАТТТ-сТоСААААЛАТТ(тсТсАТСАТСОАТТТТАТСАТ----ТСТттТасТтТАТОТАСАСОАТАТ-бт| 
138 ВТАСААСАСАРТТСАТТСТТ ТАТ T ^ 7 TAG CB T T8G^ ABA A CRGA cT TAG ТСАБАТСАТТОТА-ст АТ-тАсАЙсасоТс(ссТсАТААҺТФАТТІСАТСАТ- ---ТСТссТАтТсТАСӘТАБАТСАСАТ-бтТ 
138 ВТАСААСАСАТТТОАТТОТТ CAT ^ 7 TAG CT ТЕЗА ABA A CRGA CT TAG IEIBAGBATOATEGRA - cT AW - TAcABGAcoRcEGGEGATABREIGATIS CATORT - ---Т61Тсс|бтІсТАТОТАБАССАСАТ-бтІ 
138 ӘТАСААСАСАТТТААТТОТТТСАТТАТТАсСбтТббАТСБААСВААСТТАсТТСАБАТСАТТОТА-ссТАТ-тАсАҚсосоТс(ссТбАТААТФАТТТСАТСАТ- - - -TEXccEGTEGPATGTABATBACAT -8Br] 
138 ВТАСААСААСТТТВААТСТОТТАТссоссААсбАТббтТАСсстААСАСААСТТСАВАТСАТТОТС-ТАТТТ-стсосАлАААТТТтСТсАТСАТСАТТТТАТСАТ----ТСТттТбс(тТАТӘІСБАСбАСАТ-бті 
120 ӘТАСААҺСАЛАТТТСОАТТСТТ САПЙТАТТААСбтТӘбАТАСААСВАААТТАСТТСАБАТСАТТОТА-стШАТ-тАСАЙсасоТс(сс(сАТАҺТОАТТІСЕТСАТ - ---ТСТссТбАТСТАСОТАСАССАТА(-бт| 
138 ВТАСААСААСТТТСОААТСТОТТАТссссААсбАТбӨбТТАСсстААСАСААСТТСАБАТСАТТСОТС-ТАТТТ-стосАААААТТТтСТсАТСАТСАТТТТАТСАТ----тСТтттастттАТОТАБАТСАТАТ-бтТ 
138 БТАСААСАСАТТТСОАТТОТТ сАТТАттАссбтТӘбАТАСААСАсасттАс ТСАБАТСАТТОТА-ст(АТ-тасАЙсасоТс(осТсАТАЛТФАТТІСАТСАТ----ТӘТссТбӨтІсТАТОТтБАССАСАТ-6017 
138 БТАСААСАСА ТТСАТТОТТТСАТТАТТАСТ ттӘФАТАСААСАСсасттАС ТСАФАТСАТТОТА-стПАТ-тТАсАЙсАсоФс сстоАТААТСАТТТТАТСАТ----ТАТосТат сГАТОТАБАССАСАТ-бсТ 
131 ВАКФАСАҺАССТТссАТбсоТосТасттАСттстААСТАбАААСАСтбтсосТбФАВАТСАСТтТт -Тс(тс-сстаЙАсоса - --бслАстсабосТТсАстосаАлт -cBRAGRA - --ГАТОТАБАТСАТАТ-бсТ 
L1 0 3 uus wuul 43 5-9 ubBEECNSS INS qs uc. 
138 ВТАФААСААСТТТСОААТСТОТТАТССАСААССАТӨбТТАТсстААСАСАҚСТТСАБАТСАТТСОТС-ТАТТТ-стТсосАААААТТТтСТСАТСАТбАТТТТАТСАТ----ТСТттТбсттТАТбТСбАТбАТАТ-бСТ 
138 АТАСААСААСТТТСОААТСТАТТАТоссссАсбАТббТТАттотААСсАСААСТТСАФАТСАТТОТС-ТАТСТ-СТАСАААААТТТтсТсАССАТФАТТТТАТСАТ----ТСТттТосТтТАТОТАВАССАСАТ-бсТ 
138 БТАСААСААСТТТОАЛАТСТОТТАТОсАСААСбАТӨбТТАбсстААСсАСААСТТСАБАТСАТТОТС-ТАТТТ-стосАААЛАТТ тсТбАТСАТФАТТТТАТСАТ----ТСТттТӘсТтТАТОТАВАТСАТАТ-бсТ 
138 ВТАСААСААСТТТСОААТСТОТТАТССАСААСбАТббТТАСсСсСтААСАСААСТТСАбАТСАТТОТС-ТАТТТ-стссАААЛАТТТтСТСАТСАТСАТТТТАТСАТ----ТСТттТбӘс(тТАТбОТСБАТСАТАТ-бсТ 
12 ӘТАСААСАСАТТТСОАТТСст сАЙТАтТтАтсбоТбАТТАСААСВААСтттАСТФАБАСБАТТТТА-стШАТ-тАСАЙсАсоТс АСТАЮТСАТФАТТІСАТСАТ----ТСТссТбтІсТАТОТАСАТСАСАТ-бсТ 
135 ВТАСАҺСААСТТСБАСТ тс ТАТсослсАлбААЛӨбсСТАСААСААСАСТАС ТОтБАТСАТТӘТС-ТАПТТ-сТТАЙАСАСТТІоС АСТААТСАТТТТАТТАТАТАТСОТТТІОАТАҒАТОТАСАТСАТАТ-бсТ 
138 ВТАСААСААСТТТСОААТСТСТТАТстсссАсбасббтТАбсстААсАСААСТТСАБАТСАТТОТС-ТАТТТ-стосАААААТТ тсТсАТСАТФАТТТТАТСАТ----ТОТттТасТтТАТОТАБАСбАСАТ-бтТ 
138 8ТттттбАААТТСАсс( Т - - - пт ттолостттс АЙС -АААСАААСсСАсоБАбАТСАТТссбттт АТАСТОТСАТААТТСАСААССОАААҚСТоТтТАСТ------ТоАТААТОТАСВТАБАТСАСАТ-бСТ 
135 ӘТАЕЖАСАСАТТТӘАТТ6Тт сАТтАттАссбттббАТАФААСЕслсттАсАТФАбАТСАТТӘТА-сс(сТ-тасАҚсАсоТс сс бАТААЙТВАТТІСАТСАТ----ТЕТссТаАт|сТАТӘТАБАСФАСАТ-бст 
138 ӘТАСААСАСАТАТСАТТОТт CART A T TAG CT TBG^ ABA ACA GAcT TAG ТТАБАТСАТТОТА-ссСТАТ-тАтАҚсАсоТс(сосТсАТААТАЮТТІСАТСАТ- ---ТСТссТбтІсТАТОТАСАССАСАТ-бсТ 
138 А САС АСА т BG c AR CAT AT TAG CB T TBA TAB AA CR GACTTCAGRTABACBEATTGTA cr- TAcABcAcoECRAGTARTIGATGATITTATCAT- - --TEXocEGTT^PACBEcBACBACAT -eon 
138 BRAGAAGACG ^ СА т BG C AR CARET ^ 7 TAG CB T TB^ TAB AA CRGA CT T CAGR T ABACERIEEGI^ - cr АТ-тасАЙҚсасоТсТлсТААТСАТВАТТТТАТСАТ----ТСТссТбтТАҒАСОТАБАССАТАТ-бсТ 
138 BTAT AAGAAGIETTGAATETGTTATOGAGAAGBATSB T TAGco TAAGACARCETBAGATCATTGTG -TATTT-GTGCAAAAATTETCTGATGATGATTTTATCAT----TETT TEGCTTTACGTAGATGATAT ec 
138 БТАФААСААСТТСБАСТСто тАТссслсААбААббФСТАСААСВАСАСТАСТТОтбАТСАТТОТС-ТАТТТ-сТТАЙАСАСФТІсСТАСТААТбФАТТТТАТТАТ - - -- cg T TEGAR^PACBEAGACBATAT -oc 
138 8 ТтЕсслАсАР АасастовстАТсАллАвотАсббо АбФАААСАААСТИАС бтбтсБАТАС - --TrART TT TGRARAAAAGGGAABA T EGARCACRRGCR- -----ТАл сАТАҒАСВІСБАСбАТАТ-бсТ 
139 ӘТАСААбААСТТСАЙс то тАТсссасААБААФбСТАСААСВАсАСТАС ТСтбАТААТТӘТС-ТАТТТ-сТтАЙАСАСФТсСШАСТААТАЮТТІТАТТЕТ----сӘТТТТбАТАГАТОТАБАССАСАТ-бсТ 
132 ВАВтттЕсст Тсастосст тс(тсассавбАТббсТтбАтсВААтсАҚсссатбАТФАТТСТт -тс(тс-АсСсАЙАСАСА - - - СААДИ АА ЕВссс ссстс Алт -TÉRTGRA - --ТАсбТобАТбАСАТ-бсТ 
135 ААА стт АА отот саТАс(тосаААСбтсбАТТАСААССААТСТВААСАТВАТТАТТСТТ-ТАТТс-АСТАЙСТТСАААТАҚАЙТтс то ТТАТТОТААТ -САТААТАссоТАСВТАВАТВАТАТ-боТ 
135 BAONG A AGIT CBAG RET r ТАТосслсААбААӨбСТСОбААСИАСАСТАСФ ТбтбАТСАТТӨТС-ТАТТ -сТтАВАСАСФТсСТАСТАЙТВАТТТТАТТАТ----сӘТттТТбАШАТАСОТАБАСбАТАТ-бСТ 
135 ААЮбсттАААТТстот BG ARA c стАДАС т cBATABAAGCAATOTRAACATBAT TERCERO -TARTC-ACTABCTTCAAATCRARRT CRT CIRERTAR T GRAAT -сбТААРАсссТАСӘТАБАТСАТАТ-бсТ 
138 БТАСАКСААСТТТӘААТСтТсТТА1стсссасбатббтТАСсстЕАсАСААС ФАбАТБАТТОТС-сАТт -стосАлАААТТ тсТбАТСАТВАсТІТтІСАТ----ТеТттТас ттАТОТАБАССАСАТ-бтІ 
135 ВТАСААСААСТТСБАСТатс тАТсоссасААбААВФСТАСААСВАСАСТАСФ ТОтбАТСАТТОТС-ТАТТТ-сттАЙссасТт(ссТАСсТААТФАТТТТОТТАТ----с6ТттІбАТАРАТОІТБАСбАТАТ-б6СТ 
120 ӘТАСААҺСАСАТТТСАТ АСТ САЙТАТТАссбтТбАТТАСААСАсАсттСААТФАФАССАТТОТС-ст(АТ-тТАСАЙСААСТСТАСТАЙТААТОАТТІСЕТСАТ----ТСТсс|бтІсТАтоТсбАТСАСА(-6сТ 


138 ВТАСААСААСТТТСОААТОтоТТАТстсалсАсбАтТббтТАСсстААСАСАҚСТТСАВАТСАТТбОТС-ТАТТТ-стосАААААТТТтСТбАТСАТбАТТТТАТСАТ--.-тСТтттасТтТАТОТАВАСбАТАТ-бсТ 
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Fig.2 Multiple alignment of reverse transcriptase of Tyl-copia-like retrotransposons amplified 


from Arachis duranensis 
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Ё з Arachis duranensis 中 Tyl-copia 类 反 转 录 转 座 子 RT 基因 序列 的 比 对 logo 
Fig.3 Alignment logo of reverse transcriptase of Tyl-copia-like retrotransposons amplified from 


Arachis duranensis 

22 RT 基因 序列 分 析 

利用 BioEdit 软件 对 RT 基因 序列 进行 统计 分 析 , 结果 显示 , 所 有 序列 长 度 都 在 256 ~270 
bp 之 间 , 存在 缺失 或 插入 突变 。 在 Arachis duranensis (PI262133) 的 41 条 序列 中 , AdRT1-47 
的 序列 长 度 最 短 ， 为 256 bp，AdRT1-11 的 序列 长 度 最 长 ， 为 267 bp， 长 度 为 266 bp 的 序列 
占 总 序列 数 的 90.24% (R1); A. T. C. G 数量 变化 范围 分 别 为 65~88、78~94、29~61 
和 49~67，AT 所 占 比例 范围 为 55.86%~68.42%，AT 与 GC 比例 为 1.27-2.17 CE 2) ; BË 
酸 序列 间 相 似 性 范围 为 50%~99.2%， 其 中 ，AdRT1-26 5 AdRTI-25 之 间 的 相似 性 最 高 ， 达 
99.2%, AdRT1-47 与 AdRT1-7 以 及 AdRT1-47 与 AdRT1-29 之 间 的 相似 性 最 低 ， 均 为 5096, 
氨基 酸 序 列 间 相 似 性 范围 为 4.7%~100%。 ТЕ Arachis duranensis (PI219823) 的 27 条 序列 中 ， 
AdRT2-24 的 序列 长 度 最 短 , 为 257 bp, AdRT2-7 的 序列 长 度 最 长 , 为 270 bp. 长 度 为 266 bp 
的 序列 占 总 序列 数 的 74.0796 CE DD ; A、T、C、G 数量 变化 范围 分 别 为 62~93、71~93、 
32-56 和 66~68, AT 所 占 比例 范围 为 57.20%~67.29%，AT 与 GC 比例 为 1.34~2.06 (K 2) ; 
核 苷 酸 序列 间 相 似 性 范围 为 49.8%~99.2%， 其 中 ，AdRT2-3 与 AdRT2-4 之 间 的 相似 性 最 高 ， 
iA 99.2%, AdRT2-13 与 AdRT2-27 之 间 的 相似 性 最 低 ， 为 49.8%, 氨基 酸 序 列 间 相 似 性 范围 
为 14.6%~100%。 

表 2 “Arachis duranensis” 中 Tyl-copia 类 反 转 录 转 座 子 RT 基因 序列 的 基本 信息 


Table 2 Basic information of reverse transcriptase of Tyl-copia-like retrotransposons amplified 


from Arachis duranensis 


序列 编号 大 小 AT 含量 mos 登录 号 
Sequence No. Size (bp) AT content (96) Accession No. 
AdRTI-1 266 63.16 1.71 МК830202 
AdRTI-2 266 63.53 1.74 MK830203 
AdRTI-4 266 62.78 1.69 MK830204 
AdRTI-6 266 63.53 1.74 МК830205 
AdRTI-7 266 67.29 2.06 MK830206 
AdRTI-8 266 62.78 1.69 MK830207 
AdRTI-9 266 63.16 1.71 МК830208 
AdRTI-11 267 64.42 1.81 MK830209 
AdRTI-12 266 62.41 1.66 MK830210 
AdRTI-13 266 62.03 1.63 MK830211 
AdRTI-14 266 63.53 1.74 МК830212 
AdRTI-15 266 62.78 1.69 MK830213 
AdRTI-16 262 59.92 1.50 MK830214 
AdRTI-17 266 62.41 1.66 MK830215 
AdRTI-19 266 61.65 1.61 MK830216 
AdRTI-21 266 62.78 1.69 MK830217 


AdRTI-22 
AdRTI-23 
AdRTI-24 
AdRTI-25 
AdRTI-26 
AdRTI-28 
AdRTI-29 
AdRTI1-30 
AdRTI-31 
AdRTI-32 
AdRTI-33 
AdRTI-34 
AdRTI-35 
AdRTI-36 
AdRTI-37 
AdRTI1-38 
AdRT1-39 
AdRT1-40 
AdRTI-41 
AdRTI-42 
AdRT1-43 
AdRTI-45 
AdRTI-46 
AdRTI-47 
AdRTI-48 
变化 范围 
Variation range 
AdRT2-1 
AdRT2-2 
AdRT2-3 
AdRT2-4 
AdRT2-5 
AdRT2-7 
AdRT2-9 
AdRT2-10 
AdRT2-11 
AdRT2-13 
AdRT2-14 
AdRT2-15 
AdRT2-16 
AdRT2-18 
AdRT2-19 
AdRT2-21 
AdRT2-24 
AdRT2-27 


266 
265 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
266 
256 
266 


256-267 


266 
266 
266 
266 
267 
270 
266 
262 
266 
266 
266 
266 
266 
266 
263 
267 
257 
266 


62.78 
63.02 
63.16 
62.78 
62.41 
62.78 
68.42 
62.03 
62.78 
63.53 
63.91 
64.66 
62.41 
61.28 
62.41 
63.91 
62.78 
63.53 
62.41 
65.41 
62.78 
63.16 
64.66 
55.86 
64.66 


55.86—68.42 


62.78 
63.53 
63.16 
63.16 
66.29 
64.07 
62.78 
60.69 
62.78 
63.91 
62.78 
63.91 
62.78 
62.41 
62.36 
66.29 
57.20 
67.29 


1.69 
1.70 
1.71 
1.69 
1.66 
1.69 
2.17 
1.63 
1.69 
1.74 
1.77 
1.83 
1.66 
1.58 
1.66 
1.77 
1.69 
1.74 
1.66 
1.89 
1.69 
1.71 
1.83 
1.27 
1.83 


1.27-2.17 


1.69 
1.74 
1.71 
1.71 
1.97 
1.78 
1.69 
1.54 
1.69 
1.77 
1.69 
1.77 
1.69 
1.66 
1.66 
1.97 
1.34 
2.06 


МК830218 
МК830219 
МК830220 
МК830221 
МК830222 
МК830223 
МК830224 
МК830225 
МК830226 
МК830227 
МК830228 
МК830229 
МК830230 
МК830231 
МК830232 
МК830233 
МК830234 
МК830235 
МК830236 
МК830237 
МК830238 
МК830239 
МК830240 
МК830241 
МК830242 


МК830471 
МК830472 
МК830473 
МК830474 
МК830475 
МК830476 
МК830477 
МК830478 
МК830479 
МК830480 
МК830481 
МК830482 
МК830483 
МК830484 
МК830485 
МК830486 
МК830487 
МК830488 


AdRT2-37 266 
AdRT2-38 266 
AdRT2-39 266 
AdRT2-40 266 
AdRT2-41 266 
AdRT2-42 266 
AdRT2-43 266 
AdRT2-45 267 
AdRT2-48 266 
aei à 257-270 
Variation range 


利用 MEGA6. 


0 软件 对 RT 基因 


63.53 
66.54 
61.65 
63.16 
62.78 
63.16 
64.29 
62.92 
61.65 


57.20~67.29 


1.74 
1.99 
1.61 
1.71 
1.69 
1.71 
1.80 
1.70 
1.61 


1.34--2.06 
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МК830489 
МК830490 
МК830491 
МК830492 
МК830493 
МК830494 
МК830495 
МК830496 
МК830497 


2.3 RT 基因 核 背 酸 序 列 聚 类 分 析 
序列 进行 聚 类 分 析 〈 图 4) 。 遗 传 进化 树 显示 ，68 条 序 


列 被 划分 为 6 个 家 族 , AO 工 包含 28 条 序列 , 其 中 , 18 条 来 自 Arachis duranensisC PI262133), 
10 条 来 自 Arachis duranensis (PI219823) ， 所 含 序 列 数 占 总 序列 数 的 41.18%; 20 IL 


9 条 序列 ， 家 族 II 


只 包含 AdRT1-29， 该 序列 与 家 族 工 亲缘 关系 较 远 而 单独 聚 为 一 类 ， 造 成 


该 序列 单独 为 一 类 的 原因 可 能 是 碱 基 蔡 换 ; 家 族 I 区 包含 23 条 序列 ,其 中 ,有 17 ЖЖН Arachis 
duranensis (PI262133) , 6 条 来 自 Arachis duranensis (PI219823) ， 所 含 序列 数 占 总 序列 数 
的 33.82%; 家 族 V 包 含 3 条 序列 ， 家 族 VI 包 含 4 条 序列， 家 族 V 和 家 族 VI 与 男 外 4 个 家 族 
遗传 距离 较 大 、 杂 缘 关 系 较 远 ， 这 两 个 家 族 中 的 序列 存在 碱 基 缺 失 的 现象 。 
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4 Arachis duranensis 中 Tyl-copia 类 反 转 录 转 座 子 RT 基因 的 遗传 进化 树 
Fig. 4 Phylogenetic tree of reverse transcriptase of Ty1-copia-like retrotransposons amplified 


2.4 RT 基因 和 氨基酸 序列 分 析 


利用 MEGA6.0 软件 对 RT 基因 
有 19 条 发 生 无 义 突 变 ， 其 中 ，9 条 序列 来 
Arachis duranensis (PI219823) ， 


列 总 数 的 21.95%, 


from Arachis duranensis 


10 条 序列 来 


氨基 酸 序列 进行 分 析 CE 50 。 结 果 显 示 ，68 条 序列 中 
Arachis duranensis (PI262133) ， 占 该 材料 序 


占 该 材料 序列 总 数 的 


37.04%， 就 无 义 突 变 发 生 率 来 说 ，Arachis duranensis (РІ019823) 要 比 Arachis duranensis 


(PI262133) 高 。 无 义 突变 在 2 份 花生 材料 中 的 具体 表现 为 : AdRT2-21 发 生 了 8 个 无 义 突 
变 ， 分 别 在 第 31、34、65、66、71、75、76、77 个 氮 基 酸 处 ，AdRT2-5 发 生 了 7 个 无 义 突 
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变 ， 分 别 在 第 51、58、74、75、76、77、87 个 氨基 酸 处 ; AdRTI-47 发 生 了 6 个 无 义 突变 ， 
分 别 在 第 18、26、30、37、79、82 MA AdRT1-11 发 生 了 5 个 无 义 突变 ， 分 别 在 第 
41. 71. 75. 76. 77 个 氨基 酸 处 ; AdRT1-16 发 生 了 5 个 无 义 突变 ， 分 别 在 第 54、58、80、 
81. 84 个 氨基 酸 处 ; AdRT2-10 发 生 了 5 个 无 义 突变 ， 分 别 在 第 54. 58. 81. 82. 84 A 
基 酸 处 ; AdRT1-4 发 生 了 2 个 无 义 突变 (第 26、41 个 氨基 酸 处 ) ; AdRT1-23 发 生 了 2 个 无 
义 突 变 (第 8、39 个 氨基 酸 处 ) ; AdRT1-7、AdRT1-22、AdRT1-34、AdRT1-48、AdRT2-7、 
AdRT2-11、AdRT2-27、AdRT2-37、AdRT2-38 和 AdRT2-42 都 只 发 生 了 1 个 无 义 突 变 ; 部 
分 序列 存在 连续 无 义 突变 的 现象 ， 无 义 突变 会 影响 到 反 转 录 转 座 子 的 转录 活性 。 
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* 表 示 终 止 密码 子 ，- 表示 优化 联 配 产生 的 缺口 。 


* indicates stop codes; - indicates gaps introduced for optimal alignment. 


图 5 Arachis duranensis 中 Ту1-соріа 类 反 转 录 转 座 子 RT 基因 和 氨基酸 序列 的 
多 重 比 对 及 其 logo 


Fig. 5 Multiple alignment and its logo of amino acid sequences of reverse transcriptase of 


Tyl-copia-like retrotransposons amplified from Arachis duranensis 


2.5 RT 基因 的 蛋白 结构 预测 


将 获得 的 68 条 Tyl-copia 类 反 转 录 转 座 子 RT 基因 序列 统一 翻译 成 氨基 酸 后 , + 
酸 聚 类 结果 ， 分 别 选 择 两 份 花 4 
蛋白 质 的 二 级 结构 和 三 级 结构 〈 表 3， 图 6， 
最 高 的 模板 为 dlhara、c4rs7R、dlsqwal、c5xvnM 
属于 逆转 录 酶 家 族 ， 其 余 重 白 均 为 匹配 到 逆转 录 和 蛋白 模板 。 二 
个 B- 折 县 ;三 级 结构 包含 2~6 个 转角 


ү 


ЕТЕ Е o 


E 材 料 中 每 个 家 族 中 


的 代表 序列 ， 利 月 


在 线程 


序 Phy 


图 7) ， 代 表 序 列 蛋 
， 置 信 度 均 为 16.5~86.2， 


Ей ЯҒ 
re2 预测 


白 三 级 结构 匹配 覆盖 度 


其 中 只 有 dlhara 
级 结构 包含 2~3 个 a- 


螺旋 和 5 


表 3 Arachis duranensis 中 Tyl-copia 类 反 转 录 转 座 子 RT 基因 的 蛋白 结构 信息 


和 9~30 个 氧 键 ， 还 存在 1 个 明显 的 螺旋 结构 和 2 个 不 


Table3 Protein structure information of reverse transcriptase of Tyl-copia-like retrotransposons 


amplified from Ara 


chis duranensis 


家 族 序列 号 0- 螺 旋 数 B- 折 悉数 转角 数 E bn 
Family Sequence a-helix p-strand SOL Hydrogen Send 
No. number? number? number number 
І AdRT1-36 2 5 5 25 
AdRT2-1 2 5 6 28 
AdRTI-7 2 5 5 30 
3 AdRT2-18 3 5 5 30 
III AdRTI1-29 2 5 5 29 
AdRT1-46 2 5 6 29 
di AdRT2-13 2 5 5 30 
AdRT1-16 2 5 2 16 
i AdRT2-19 3 5 6 29 
AdRT 1-47 2 5 4 9 
" AdRT2-27 2 5 3 23 
i: * 的 数据 结果 是 根据 图 6 的 蛋白 质 二 级 结构 统计 得 出 的 ; "的 数据 结果 是 根据 图 7 的 蛋白 质 三 级 结构 统 


计 得 出 的 。 


protein tertiary structure of Fig.7. 


Note: The results of “а” are based on the protein secondary structure of Fig. 6; while those of “b” are based on the 
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А 
ШЕТТЕ 10. eroe e erase sa ы. Ore is cose Vena 2... 290. cvs. s: 60 
equence TA A 
序列 9 TAFFHGDL DKEI YMEQPEGFLVKGKEDFVCKLKKS LYGLKQAP ROWYKKFESVMGKHGYR 
E Secondary 
TM — ——á— P. — —H  — шаншар ААААААААААААААА — 
二 级 结构 “structure -— RA 
— SS 
二 级 结构 置信 度 ТЕН 
无 序 区 _ Disorder ???? 22721 一 一 一 一 一 一 一 一 一 -- 
Ең Disorder 
无 序 区 信 度 confidence 
ТІСІ. río ETUR: CS . 
BETTE KTTSDHCVFVQKFSDDDFIILLLYVDDM Confidence Key 
Secondary | | o U High(9) un Low (0) 
structure ? Disordered ( 1696) 
5 ал Alpha helix ( 19%) 
confidence Нн НЕН ЕТ => Beta strand ( 33%) 


Disorder 
confidence 


B Tni em sem na sea. s rcs mos s x is uoces m. mes SO x e i 90. 
BETTER I^AFFHGDLDKEIYVEQPEGFVVKGKEDFVCKLKKS LYGLKQAP ROWYKKFESVMEKHGYR 
Secondary | .—  . A EE o TEM 

en ——————. = — ААМ ARAS S SS S S SS S 
SS 
confidence 
Disorder ???? 22252? 
confidence 
када лын nce ә e nsa. x Аа ажа 
| Ѕедиепсе KTTSDHCVFVQKFSDDDFI I LLLYVDDM Confidence Key 
Secondary М —À High(9) ІТ 0 оғ (0) 


structure 


? Disordered ( 1696) 
confidence AA Alpha helix ( 20%) 
Disorder 一 -一 2? => Beta strand ( 32%) 


A: AdRTI1-36; B: AdRT2-l. Т. 
А: AdRTI1-36; B: AdRT2-1. The same below. 
图 6 Arachis duranensis 中 Tyl-copia 类 反 转 录 转 座 子 RT 基因 的 蛋白 二 级 结构 


Fig. 6 Protein secondary structure of reverse transcriptase of Tyl-copia-like retrotransposons 


amplified from Arachis duranensis 


^w. ow 


图 7 Arachis duranensis 中 Tyl-copia 类 反 转 录 转 座 子 RT 基因 的 蛋白 三 级 结构 


Fig.7 Protein tertiary structure of reverse transcriptase of Ty1-copia-like retrotransposons 


amplified from Arachis duranensis 

2.5 RT 基因 保守 基 序 预测 

RT 基因 保守 基 序 预测 结果 显示 ，68 条 序列 共存 在 11 种 保守 基 序 ， 其中， 有 57 条 序列 
同时 包含 motif 1. motif 2 和 motif 3， 占 总 序列 数 的 83.82%， 说 明 这 3 种 保守 基 序 是 AA 染 
色 体 组 野生 种 花生 Tyl-copia 类 反 转 录 转 座 子 RT 基因 的 主要 保守 基 序 ， 这 也 从 保守 基 序 角 
度 表 明 两 个 АА 染色 体 组 野生 种 花生 Tyl-copia 类 反 转 录 转 座 子 RT 基因 具有 非常 高 的 保守 
性 与 相似 性 ; AdRT2-27 和 AdRT2-38 同时 包含 motif 3、motif 4 和 motif 6, motif 4 和 motif 6 
这 两 个 保守 基 序 在 位 置 上 与 motif 1 和 motif 2 相同 ， 但 氨基 酸 的 排列 和 组 成 并 不 相同 ; 
AdRTI-11 包含 motif 1. motif 3 和 motif 7; AdRT1-16 和 AdRT2-10 同时 包含 motif 1 和 motif 
5， 在 系统 进化 树 中 ， 这 2 条 序列 为 同一 类 ; AdRT2-19 包含 motif 1 和 motif 10，AdRT2-24 
包含 motif 8. motif 9 和 motif 10，AdRT2-21 包含 motif 1 和 motif 7， 这 3 条 序列 在 系统 进 
化 树 中 均 单 独 归 类 ; AdRT1-47 包含 motif 8 和 motif 9, AdRT2-5 £5 motif 7、motif 8 和 motif 
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11, AdRTI-23 只 包含 motif 11， 这 3 条 序列 在 系统 进化 树 中 归 为 同一 类 ， 其 中 ，motif8 和 
motif 11 的 长 度 较 短 ， 位 于 序列 上 游 部 分 。 部 分 保守 基 序 在 所 克隆 序列 中 出 现 的 频率 较 低 且 
长 度 较 短 ， 说 明 这 些 序列 在 进化 过 程 中 发 生 了 突变 (图 8) 。 
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8 Arachis duranensis 中 Ту1-соріа 类 反 转 录 转 座 子 RT 基因 保守 基 序 预测 
Fig. 8 Conservative motifs prediction of reverse transcriptase of Tyl-copia-like retrotransposons 
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2.6 RT 基因 序列 系统 进化 树 构 建 

构建 系统 进化 树 ( 图 9) ， 所 有 RT 基因 序列 可 分 为 10 类 ， 大 部 分 RT 基因 序列 都 聚 在 
A 和 B 两 大 类 中 , 表明 本 研究 中 AA 染色 体 组 野生 种 花生 的 RT 基因 序列 具有 相当 高 的 保守 
性 与 相似 性 ,A 类 包含 20 条 来 自 4rachis duranensis(PI262133) 和 15 条 来 自 4rachis duranensis 
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(РІ219823) 的 序列 ， 这 35 条 序列 与 来 自 葡萄 C Vitis vinifera, CAN67451.1) ~ RE (Vigna 
radiata, AAT90460.1. AAT90479.1) . ЖУ. (Cicer arietinum, CAD59770.1) . B% 

CSolanum tuberosum, CAA13067.1) ~ #2: (Panax quinquefolius, ABU94811.1) . Ж 
№] CCamellia sinensis, САЈ09751.1) 、 李 子 (Prunus salicina, AGX45518.1) 、 苹 果 (Malus 
domestica, ABS11062.1) 、 烟 草 (Nicotania tabacum, AAA03507.1) 的 序列 之 间 具 有 较 高 
相似 性 ,亲缘 关系 较 近 。B 类 包含 17 ЖЖН Arachis Фиғапепвіз(РІ2621330415 ЖЖ Н Arachis 
duranensis (PI219823) 的 序列 , 说 明 这 22 条 序列 之 间 具 有 较 高 相似 性 。C 类 只 有 AdRT1-29， 
该 序列 与 来 自 油菜 (Brassica napus, AAA32987.1) ~ ЖИЕ (Prunus тите, ABF57071.1) 、 
大 豆 (Glycine тах, E47759) . ZZ (Chenopodium quinoa, АЕХ61031.12. #1 (Lycopersicon 
esculentum, AAC34611.1) 、 大 狗 尾 草 (Setaria faberi, АА136472.1) ~ Кй (Oryza sativa, 
AAA33902.1) 和 玉米 (Zea mays, AAK84849.1) 的 序列 之 间 具 有 较 高 相似 性 ， 亲 缘 关 系 较 
Ін. 类 中 是 来 自 绿豆 、 欧 洲 云 杉 和 石 获 的 3 条 序列 ,这 3 条 序列 与 大 多 数 AA 染色 体 组 野 
生 种 花生 和 其 它 物种 植物 的 序列 亲缘 关系 较 远 。E 类 只 包含 2 条 序列 ， 分 别 是 来 自 AA 染色 
体 组 野生 种 花生 的 AdRT2-24 和 拟 南 芥 的 S71291， 说 明 这 2 条 序列 之 间 亲 缘 关 系 最 近 。F 类 
~J 类 中 的 3 条 和 7 条 序列 分 别 来 自 Arachis duranensis (PI262133) 和 Arachis duranensis 

(PD19823) ， 均 不 包含 其 它 物种 植物 的 序列 。 


图 9 Arachis duranensis 与 部 分 其 他 物种 植物 Tyl-copia 类 反 转 录 转 座 子 RT 基因 序列 的 系 
统 进化 树 


Fig.9 Phylogenetic tree of reverse transcriptase of Tyl-copia-like retrotransposons from Arachis 


duranensis and some other plant species 


3 讨论 与 结论 


本 研究 用 同一 简 并 引物 从 同一 种 野生 花生 种 质 中 克隆 获得 的 Ty1-copia 类 反 转 录 转 座 子 
RT 基因 的 核 苷 酸 和 氨基 酸 序列 在 序列 长 度 、 序 列 组 成 及 序列 相似 性 等 方面 存在 较 大 差异 和 
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多 态 性 ， 表 明 同 一 种 野生 花生 种 质 内 同一 类 群 反 转录 转 座 子 存在 较 高 异 质 性 。 另 外 ， 两 份 野 
生 种 花生 材料 中 RT 基因 序列 均 富 含 AT 碱 基 ， 室 含 AT 导致 呈现 较 高 异 质 性 ;， RT ЖА 
酸 序列 间 相 似 性 呈现 较 高 异 质 性 有 19 条 氨基 酸 序 列 发 生 了 无 义 突变 ， 导 致 呈现 较 高 异 质 
性 ; RT 基因 和 氨基酸 序列 间 相 似 性 呈现 高 度 异 质 性 ，68 条 RT 基因 序列 间 保 守 基 序 也 呈现 一 
定 异 质 性 ; 家 族 V 和 家 族 VI 中 的 代表 序列 在 螺旋 结构 、 折 又 结构 、 转 角 数 、 氧 键 数 上 与 其 他 
家 族 代表 序列 存在 的 较 大 差别 ， 呈 现 较 高 异 质 性 和 多 态 性 。 总 之 ， 两 份 野生 种 花生 材料 中 
RT 基因 序列 在 AT 碱 基 含 量 、 核 芽 酸 序列 间 相 似 性 、 和 氨基酸 序列 间 相 似 性 、 和 氨基酸 无 义 突 
变 率 、 保 守 基 序 、 和 蛋白 质 二 级 结构 及 三 级 结构 上 均 呈 现 异 质 性 。 

家 族 [~ 区 中 代表 序列 的 和 蛋白 质 三 级 结构 在 整体 构 型 上 基本 类 似 ， 但 在 螺旋 结构 数 、 折 
登 结构 数 、 转 角 数 和 氢 键 数 上 存在 较 大 差别 ， 家 族 V 中 的 AdRT1-16 只 存在 2 个 明显 的 螺旋 
结构 ， 其 转角 数 和 氧 键 数 也 明显 少 于 其 他 序列 ， 家 族 VI 中 的 AdRT1-47 的 氧 键 数 远 远 少 于 其 
它 序 列 ， 其 转角 数 也 少 于 其 他 序列 ， 且 其 螺旋 结构 较 短 ，AdRT2-27 相 较 于 其 他 序列 存在 
个 明显 的 折 针 结构 和 1 个 不 明显 的 折 著 结构 , 其 转角 数 和 和 氢 键 数 都 少 于 其 他 序列 , 推测 这 些 
差别 可 能 会 影响 到 Ty 1-copia 类 反 转 录 转 座 子 的 拷贝 数 、 转 录 活 性 及 转 座 效率 等 。 

遗传 进化 树 显示 ，6 个 家 族 中 的 1 和 人 凡是 主要 家 族 ， 表 明 AA 染色 体 组 野生 种 花生 
Tyl-copia 类 反 转 录 转 座 子 RT 基因 序列 具有 非常 高 的 保守 性 与 相似 性 。 另 外 ， 各 家 族 内 部 
成 员 越 复杂 ,序列 相似 性 越 高 ， 存 在 有 转录 活性 的 反 转 录 转 座 子 的 可 能 性 也 越 大 ， 其 转 座 发 
生 的 时 间 可 能 越 近 (Tang et al., 2005) ， 由 此 推测 ， 家 族 I 和 家 族 区 很 有 可 能 是 存在 具有 转 
录 活 性 的 Tyl-copia 类 反 转 录 转 座 子 的 家 族 ， 存 在 的 历史 也 更 为 久远 。 

系统 进化 树 显示 ，A 类 中 的 35 Ж АА 染色 体 组 野生 种 花生 RT 基因 序列 与 葡萄 、 绿 豆 、 
认 跨 豆 、 马 铃 茵 、 西 洋 参 、 时 茶树、 李子、 荚果、 烟草 的 序列 之 间 相 似 性 较 高 ; C 类 中 的 
AdRT1-29 与 来 自 油菜 、 梅 花 、 大 豆 、 蔓 麦 、 鼻 若 、 大 狗 尾 草 、 水 稻 、 玉 米 的 序列 之 间 相 似 
性 较 高 ，E 类 中 的 AdRT2-24 与 拟 南 芥 的 571291 之 间 的 相似 性 较 高 ， 推 测 AA 染色 体 组 野 
生 种 花生 Tyl-copia 类 反 转 录 转 座 子 曾 可 能 与 这 些 物种 植物 间 发 生 过 横向 传递 。F 类 ~J 类 中 
的 RT 基因 序列 均 来 自 AA 染色 体 组 野生 种 花生 ， 且 与 AA 染色 体 组 野生 种 花生 和 其 他 物种 
植物 的 RT 基因 序列 遗传 距离 最 大 ， 杀 缘 关 系 最 远 ， 反 映 这 几 类 中 的 RT 基因 序列 在 起 源 和 
进化 上 可 能 较为 古老 ， 特 异性 比较 强 ， 有 可 能 为 Arachis duranensis (PI262133) 和 Arachis 
e duranensis (PI219823). 所 特有 。 
一 总 之 ， 本 研究 从 АА 染色 体 组 野生 种 花生 中 成 功 克 隆 到 Tyl-copia 类 反 转 录 转 座 子 ЕТ 
Oo 基因 序列 , 对 花生 属 基于 LIR 反 转 录 转 座 子 的 分 子 标记 开发 及 花生 分 子 育种 具有 重要 意义 ， 
将 为 下 一 步 分 离 其 全 长 序列 、 研 究 其 转录 和 转 座 活性 及 功能 提供 序列 基础 。 
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